監控、管理及維護您的網站管理您的 Sitemap

xml_sitemaps_sitemap_generator_

什麼是 Sitemap?

「Sitemap」是一種檔案,您可以在其中列出網站上的網頁,讓 Google 和其他搜尋引擎瞭解您的網站內容架構。搜尋引擎網路檢索器 (例如 Googlebot) 會讀取這個檔案,以更靈活的方式檢索您的網站。

此外,Sitemap 可以針對 Sitemap 中列出的網頁提供有價值的關聯「中繼資料」:中繼資料是指網頁相關資訊,例如網頁上次更新的日期、網頁變更頻率,以及相對於網站中其他網址的重要性。

您可以使用 Sitemap 提供與特定網頁內容類型 (包括影片圖片內容) 相關的中繼資料給 Google。舉例來說,您可以為 Google 提供影片與圖片內容的相關資訊:

  • Sitemap「影片項目」可以指定影片的播放時間、類別以及適當的年齡分級。
  • Sitemap「圖片項目」可以包含圖片主題、類型與授權的相關資訊。

是否該使用 Sitemap?

如果網站上的頁網頁連結妥當,我們的網路檢索器通常可以找出大部分的網站內容。即使如此,Sitemap 還是能夠改善網站的檢索結果,尤其當您的網站符合下列其中一項條件時更有幫助:

  • 網站規模極大: Google 網路檢索器很有可能會因此漏失部分新網頁或近期更新的網頁,沒有檢索到。
  • 網站擁有大量的內容網頁,但這些網頁處於隔離狀態或彼此之間沒有適當的連結: 如果網站上的網頁無法彼此參照,您可以將這些網頁列在 Sitemap 中,確保 Google 不會漏失部分網頁。
  • 網站才剛建立,而且連往該網站的連結不多: Googlebot 和其他網路檢索器是透過網頁層層連結的方式來檢索網頁,因此如果沒有其他網站連往您的網頁,Googlebot 可能很難發現這些網頁。
  • 網站使用 Google 新聞中顯示的互動式多媒體內容,或使用其他與 Sitemap 相容的註解。在適當的情況下,Google 會把 Stiemap 所提供的額外資訊納入搜尋範圍。

 

※由於 Google 的處理程序仰賴複雜的演算法來安排檢索作業,因此即便您使用 Sitemap,Google 也無法保證一定會檢索 Sitemap 中的所有項目並建立索引。不過,提交 Sitemap 絕對不會造成負面影響;在大多數情況下,網站都能因此而受惠。

 

建立並提交 Sitemap

本頁說明如何建立 Sitemap,以及如何讓 Google 存取 Sitemap。

建立並提交 Sitemap:

  1. 決定您要讓 Google 檢索網站上的哪些網頁,同時確認每個網頁的標準版本
  2. 決定要使用的 Sitemap 格式。您可以手動建立 Sitemap,也可以選擇透過各種第三方工具產生 Sitemap。
  3. 使用 Search Console Sitemap 測試工具來測試您的 Sitemap。
  4. 在 robots.txt 檔案中加入您的 Sitemap,並且提交到 Search Console,讓 Google 存取您的 Sitemap

Sitemap 格式

Google 支援數種 Sitemap 格式,以下提供進一步的說明。

不論採用何種格式,單一 Sitemap 的檔案大小上限為 10MB (未壓縮),且其中包含的網址數量最多為 50,000 個。如果您的檔案較大或網址數量較多,則必須將清單分割成數個 Sitemap。您可以選擇建立 Sitemap 索引檔 (指向 Sitemap 清單的檔案),然後將單一索引檔案提交給 Google,也可以將多個 Sitemap 和/或 Sitemap 索引檔提交給 Google。

Sitemap 通用規範

  • 使用一致且完全符合規定的網址。Google 會完全按照列出的網址進行檢索。舉例來說,如果您的網站位於 http://www.example.com/,請不要將網址指定為 /http://example.com/ (不含 www) 或 ./mypage.html (相對網址)。
  • 請勿加入 Sitemap 中網址的工作階段 ID,以避免重複檢索這些網址。
  • 指出網址的翻譯版本以供 Google 檢索及建立索引,方法是在 Sitemap 檔案中列出每種語言的標準網址,並使用 hreflang 註解
  • Sitemap 檔案必須使用 UTF-8 編碼,並且適當逸出網址
  • 將大型 Sitemap 分割成數個較小的 Sitemap,以免 Google 頻繁要求 Sitemap,造成伺服器發生超載情形。每個 Sitemap 檔案最多只能包含 50,000 個網址,而且解壓縮後的檔案大小不得大於 10 MB。
  • 使用 Sitemap 索引檔,在其中列出您所有 Sitemap 並提交給 Google,而不要提交個別 Sitemap。
  • 如果從您的 www 網域和非 www 網域都能存取您的網站,請使用建議的標準化方法告知 Google。您只需針對偏好的網域提交 Sitemap。
  • 如果您考慮聘請顧問來協助您進行 Sitemap 最佳化作業,請熟讀我們的《網站管理員指南》和《搜尋引擎最佳化 (SEO) 入門指南。此外,諮詢經營相似網站或公司的同業也能幫助您善用 Sitemap。
  • 非英數字元和非拉丁字元。 我們要求您將 Sitemap 檔案以 UTF-8 編碼 (您通常可以在儲存檔案時這麼做)。與所有 XML 檔案一樣,下表所列字元的資料值 (包括網址) 都必須使用實體逸出碼。Sitemap 只能包含 ASCII 字元,不可包含大寫 ASCII 字元、特定控制碼或特殊字元,例如 * 和 {}。如果您的 Sitemap 網址包含這些字元,您新增網址時就會收到錯誤訊息。

1484105746425

  • 此外,所有網址 (包含您 Sitemap 的網址在內) 都必須以網址所在與逸出的網路伺服器可解讀的方式編碼。不過,如果您使用任何類型的指令碼、工具或紀錄檔來產生網址 (除了手動輸入外的任何方式),那麼通常這些方式都已經執行此動作。提交 Sitemap 後,如果收到 Google 找不到部分網址的錯誤訊息,請確定您的網址符合 RFC-3986 URI 標準、RFC-3987 IRI 標準及 XML 標準
    以下這個範例網址使用了非 ASCII 字元 (ü) 和需要實體逸出的字元 (&):
    http://www.example.com/ümlat.html&q=name
    以下是同一個網址,但使用了 ISO-8859-1 編碼 (供使用這種編碼的伺服器代管),且網址已逸出:
    http://www.example.com/%FCmlat.html&q=name
    以下是同一個網址,但使用了 UTF-8 編碼 (供使用這種編碼的伺服器代管),且網址已逸出:
    http://www.example.com/%C3%BCmlat.html&q=name
    以下是同一個網址,且實體已逸出:
    http://www.example.com.tw/%C3%BCmlat.html&q=name

針對其他媒體類型使用 Sitemap 擴充元素

Google 支援以下媒體類型的 Sitemap 擴充語法。您可以使用這些擴充元素描述您網站上的影片檔、圖片和其他不易剖析的內容,協助 Google 提升索引效能。

讓 Google 存取您的 Sitemap (將您的 Sitemap 提交給 Google)

您可以透過兩種方式讓 Google 存取您的 Sitemap:

發佈留言